MySQL同列不同行计算

您所在的位置:网站首页 sql 两行数据相减 MySQL同列不同行计算

MySQL同列不同行计算

2023-12-10 09:55| 来源: 网络整理| 查看: 265

目录 一、问题二、导入数据三、利用变量保存前值四、最终解决方案五、小结

一、问题

有下面这样的一张表:

dateamount2015-12-3130002016-01-2231002016-01-2331002016-01-2431002016-01-2531002016-01-2631002016-01-2731002016-01-2831002016-01-2931002016-01-3031002016-01-3133002016-02-0134002016-02-023500

想要获取像下面这样的结果:

yearmonthdiff2016130020162200

写出SQL语句。

从结果可以猜测,就是求每一个月与上一个月的累计值之间差值,其中amount的值是已经是累计值,所以需要再sum计算了。

初一看非常简单,不就是按年和月分组统计吗?

仔细一想其实没有想像中那么容易,最要是要计算行之间的差值,在MySQL中计算列之间的差值非常容易,难点在于要计算行之间的差值,这需要一点小技巧,通过MySQL变量和子查询把列值转换为行值。

注意:对于高并发的业务,我们一般不会把这样的计算放在MySQL中,尽量在应用层处理,或者直接走统计,因为在高并发业务中保护数据库是我们重要的责任。

当然如果仅仅是一些离线的报表或者统计业务当然是没有问题,因为离线报表之类的业务可以用到,所以下面的小技巧还是可以了解一下。

二、导入数据

首先创建表:

CREATE TABLE `stat_year` ( `stat_date` date NULL DEFAULT NULL, `amount` int UNSIGNED NULL DEFAULT NULL ) ENGINE = InnoDB CHARACTER SET = utf8 COLLATE = utf8_general_ci ROW_FORMAT = Dynamic;

加载数据,忽略掉第一行表头:

load data local infile 'data.txt' into table amount fields terminated by '\t' ignore 1 lines;

导入后数据

三、利用变量保存前值

我们先来了解一下MySQL在SQL语句中怎样使用变量。

SELECT tmp.stat_date, tmp.current_amount, tmp.pre, ( tmp.current_amount - tmp.pre ) AS diff FROM ( SELECT stat_date, amount AS current_amount, @pre_amount AS pre, @pre_amount := sp.amount FROM stat_pay sp, ( SELECT @pre_amount := 0 ) AS pre_temp ) AS tmp;

利用变量保存前值

首先,MySQL中用户变量是以@开头,系统变量@@开头,赋值使用的是:=

所以,sql中的

( SELECT @pre_amount := 0 ) AS pre_temp

相当于定义了一个用户变量@pre_amount并且初始化它的值为0。

第一个from语句的子查询部分就相当于没选择一行,先给访问@pre_amount的值做为前值并且给了一个别名pre,然后在将当前行的值赋值给@pre_amount。

现在最外层的查询就容易理解多了,就是查当前行的值,当前行前一行的值,和当前行的值与前行值的差值。

我们来看一下上面的SQL语句的explain结果:

explain

explain的输出说明:

id是每一个select的标识,id越大优先级越高,越先执行,id相同的从上向下执行select_type:PRIMARY表示最后执行的select;DERIVED表示from语句中的子查询table表示使用的表,表示使用id为2得到的派生表

现在我们来再来看explain的输出,就清晰多了:

首先找id最大的,id为3的最大,最先执行,我们可以看到select_type是DERIVED,表示它会生成一个派生表,其实就是相当于定义了一个变量@pre_amount放在一张表中,这个表的别名是pre_temp,这个是第2个from语句中的子查询。

id为2的有2个,select_type都是DERIVED,因为这个2个都是第一个from语句中的子查询。 从上往下,我们看到第2行的table是,表示它使用的是id为3的查询生成的派生表,也就是pre_temp这张表。type为system,表示这张表只有1行,从rows也可以看出来。

第3行table是sp表示直接使用了sp这张实际表,sp是stat_pay的别名。

最后id为1的select_type是PRIMARY表示这是最后执行的最外层查询,table是表示使用的表是id为2的查询得到的派生表。

四、最终解决方案

因为要按年、月分组,而我们只有日期,所以我们可以通过substring或者date_format来计算出年和月的值。

SELECT substring(stat_date,1,4) AS stat_year,substring(stat_date,6,2) AS mon FROM stat_pay; SELECT date_format(stat_date,'%Y') AS stat_year,DATE_FORMAT(stat_date,'%m') AS mon FROM stat_pay;

下面我们看一下我们最终的SQL:

SELECT tmp.stat_year, tmp.mon, tmp.current_amount, tmp.pre, ( tmp.current_amount - tmp.pre ) AS diff FROM ( SELECT total_tmp.stat_year, total_tmp.mon, total_tmp.total_amount AS current_amount, @pre_amount AS pre, @pre_amount := total_tmp.total_amount FROM ( SELECT substring( stat_date, 1, 4 ) AS stat_year, substring( stat_date, 6, 2 ) AS mon, max( amount ) AS total_amount FROM stat_pay GROUP BY stat_year, mon ) AS total_tmp, ( SELECT @pre_amount := 0 ) AS pre_temp ) AS tmp;

result

如果你是一个完美主义者,想要结果一模一样,不想年月中有前缀0,可以通过下面的3种方式的任一一种把字符串转换为整型:

substring( stat_date, 1, 4 ) + 0 AS stat_year convert(substring( stat_date, 6, 2 ),unsigned integer) as stat_year cast(substring( stat_date, 6, 2 ) as unsigned integer) as stat_year

最后通过limit语句把第一行过滤掉,得到最终结果:

perfect-result

五、小结

我们可以通过在from语句中使用select创建一张派生表来存放一个临时变量,然后在select语句中操作这个变量。

举一反三,我们当然也可以在临时表中存放多个变量,不止是同列之间的计算,完全可以不同列的计算。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3